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net6 Strategie zur Verteilung der DatenlDlocke ub.er" das 
Speichersystem zu finden, die einen schnellen Zugriff 
auf die Daten und . 6ine hohe Sicheirheit gegeri Daten- 
verlust erlaubt • Im Rahmen, der Beschreibung .wird im 
Folgeiiden zwischen einer Menge von ^ auf die ' Datenblocke 
zugreifenden Einheiten, den Clients, lind einer Menge 
von Einheiten,. die Datenblocke ausliefert, den Servem, 
unterschieden. Die Begriffe Server ui^d Datenspeicber- 
system werden dabei* synonym verwendet ... 

I 

Die im • Fol'genden betrachteiten Verf ahren imd Systeme 
dienen zum Aufbau ' voh verteilten Datenservern iind 
Speichernetzwerken, sowie zum Aufbau von Web-Systemen 
zum Caching von Daten. Ein verteilter Datenserver, bzw, 
^ ein Speichernetzwerk, besteht im Allgeraeinen aus einer 
Menge voti Computersystemen, die uber ein Netzwerk mit 
einer Menge von Datenspeichersystemen, verbunden sind. 
Das Verbindungsnetzwerk zwischen den Compute rsystemen 
iind den Datenspeichersystemen besteht aus einer Menge 
von Switches bzw. Routerii, die eine - Zustellu^g der 
Datenpakete zwischen kommunizierenden Einheiten 
sicherstelle?! (siehe Fijgur 1) . Weiterhin kann das 
System uber eine Menge von SAN- Appliances (SAN = 
Storage Area Network) • verfugen, die an das Netzwerk 
angekoppelt sein konnen und ein Koordination zwischen 
den einzelnen Computersystemen xind den 

Datenspeichersystemen sicherst^llen (siehe . Figur 2).' 
Weiterhin konnen so genannte . In-Bahd~Appliances 
zwischen die Computer systeme und die Daten- 
speichersysteme geschaltet werden (siehe Figur 3) . In- 
Band- Appliances finden bei der. so genannten In-Band- 
Virtualisierung Verwendung. Bei der In-Band- 
Virtualisierung befindet sich die Kontrollinstanz , die 
In-Band-Appliance, im Datenstrom zwischen Server und 



Speicher. Die Steuerdaten wie auch die Nutzdaten laufen 
durch, die Appliance, . die den Servern als das 
Speichersysterii selbst erscheint. Die Zuordhung von 
Speichersegmenten, auch als logische Voliames 
bezeichnet, zu jedem einzelnen Server geschieht hier. 
Ebenso passiert die Steuerung des Datenzugrif f s ubef 
diese J^pliance. DemgegenCiber gibt es auch den Ansatz, 
die Virtualisier\ing uber die so genannte Out-of-Barid- 
Virtualisierung zu realisiereri. In diesem Falle 
befindet sich die Appliance' a.til5erhalb des Datenpfades 
und konununiziert fiber das -Netzwerk (beispielsweise ein' 
LAN) mit dem Host-Bus-Adapter (HBA) im . Server, . der 
einen speziellen Agenten benotigt . Die Appliance 
definiert die logischen Volumes, .die ein Server 
benutzen darf . Die exakten ' Inf ormationen uber die 
zugehorigen logischen und physischen Blocke speichert 
der Searver anschlieSend auf seinem HBA. In-Band verfugt 
iiber den Vorteil, sich Tinkompliziert ins Speichernetz 
•integrieren Tuid warten zu lassen. . Da In-Band im 
Datenpfad operiert, lasst sich die Datensicherhieit 
durch eine Storage -Firewall in der SAN-Appiiance mit 
geringem Auf wand erhohen. Out-Band gestaltet sich auf 
Grund der Wechselwirkxmgen zwischen den zusatziichen 
Agenten auf den Applikationsservem void der SAN- 
Appliance komplexer. Im Gegensatz zu In-Band belegt 
diese Methode im Switch nur wenige Ports, so dass vor- 
allem bei groSen redundant ausgelegten. "SANs eine hdhere 
Skalierbarkeit zur ' Verf ugung steht. Zudem behindert ein 
Ausfall der SAN-Appliance . den Datenzugrif f nicht . Im 
Falle des Einsatzes von In -Band -Appliances werden alle 
Lese/ Schreib-Operationen der an die In-Band-Appliances 
angeschlossenen Computersysteme erst von einer der In- 
Band-Appliahces entgegengenommen , bevor sie an die 
Speichersysteme . weitergeleitet werden. Die 



Fianktionalitat zum Management iind . zur . Verteilxing der 
Daten kann dabei sowohl in die Computersysteine , in die 
.Router, als auch in die In-Band-Appliances integriert 
warden. Es wird im weiteren Verlauf davon ausgegangen, 
dass die an ein Speichernetzwerk bzw. einen verteilten 
Dateiserver angeschlossenen . Computersysteme uber alle 
fflr das Auffinden von Daten liotwendigen Inf ormationen 
verfugen. 

Ein Web-Cache ist eine Einheit in einem Netzwerk, die. 
stellvertretend fur einen pder mehrere Web- Server 
Zugriffe von Web-Clients ' beantwdrtet . Um diese 
Funktionalitat zur Verftigung zu stellen, verffigt der 
Web- Cache uber ein Speicher system, aiif dem Teile der 
Inhalte der Web-Server gespeichert werden. Speichert 
der Web-Cache die von einem Client angefragten 
.Information nicht, so wird die Anfrage an. einen 
..ubergeordne ten Web -Cache, bzw. . den ursprunglichen Web- 
server weitergeleitet und von diesem beantwortet . Web- 
Caches erfreuen sich aus verschiedenen Grunden einer 
weiten VerbreitTing ira Internet. Durch den Einsatz eines 
Web- Caches kann die . Latenzzeit, die zwischen dem 
Stellen eirier Anfrage von dem WebrClient bis zu der' 
erf olgreichen Auslieferung dfer Inf ormationen an den 
Web-Client vergeht, signifikant reduzdert werden. Die- 
ses trifft' besonders dapxi zu, wenn die Bandbreite zwi- 
schen dem Web -Cache Und dem Web- Client groSer als die 
Bandbreite zwischen dem Web- Server xind dem Web-Client 
ist Oder wenn die Belastung des Web-Server^ so hoch 
ist, dass es bei def Auslieferung der Daten in dem Web- 
Server selbst zu Stauungen kpmmt,. Weiterhin kann durch 
den Einsatz von Web-Caches der Datenverkehr im Internet 
reduziert werden, wodurch eine Steigerung der Lei- 



stungsf ahigkeit • des gesamten Systems Internet erzielt 
werden kann. 

Durch die Kooperatlpn mehrerer Web-Caches, die an ver- 
schiedenen Orten des' Internets platziert werden, * kann 
die Leistungsf ahigkeit ' des Internets deutlich ' erhoht 
werden. Beispielsweise fiir die kooperative Zusammen- 
arbeit mehrerer Web-Caches sind das NLANR (National 
Laboratory of Applied Network Research) Caching- System, 
dass aus einer Menge von Backbone -Caches in den USA 
besteht, oder das Akamai. Caching- System, das Caching- 
Services • fur Unternehmen auf der ganzeh Welt bereit- 
stellt, ' . 

Der Hauptiinterschied in der Bereitstellimg von Ver- 
fahren zum Wiederauf f inden von Daten in Speichernetz- 
werken bzw. vert eil ten Dateiservern iind fur Web- Caches 
besteht darin, dass im Falle'von Speichemetzwerkeri die 
angeschlossehen Computersysteme uber alle Inf ormationen 
bezuglxch der Platziisrxingsstrategie ^ verfugen, die zum 
Wiederauf f inden der von ihnen verwendeten Dattan not- 
wendig sind. Dieses umfasst unter anderem die Anzahl 
und die Eigenschaf ten der angeschlossenen Server, 
respektive der Datenspeichersysteme . Im Falle von Web- 
Caches verfugt der Client hingegen nur uber eine 
beschrankte Sicht des Gesamt systems, d. h. er kennt 
nicht alle an das System angeschlossene Web-Caches . 
Werden nicht alle Daten auf alien Web-Caches ge- 
speichert, kann dieses dazu fuhren, -dass der Webr Client 
e in Datum nicht von einem Web-Cache, sondern nur direkt ' 
vom' Web-Server anf ordern . kann, . da er entweder keinen 
Web-Cache kennt, der * die von ihm . ange frag ten Informa- 
tionen speichert, oder well er zwar den fur ihn re- 



levanten Web-Cache keimt,. jedoch diesen Web-Cache nicht 
als fur dieses Datum zustandig identif izieren kann. 

Um eine hohe Effizient, Skalierbarkeit und Robustheit 
eines Datenspeichersystems, bzw. eines Web-Caches 
sicherzustellen, sind* eine Reihe von Aixf orderungen zu 
erfullen. Eine geeignete Datenverwaltungsstrategie 
sollte: 

1. jede anteilsmaSige Aufteilung der Datenblocke auf 
die Speichersy3teine erfullen konnen. Fur identische 
Systeme wird in der Regel die gleichm^Sige Ver- 
teilung der Datenblocke \iber die Systeme gefordert. 

2. es ermoglichen,' die Datenfragen gemafi der anteils- 
malSigen Zuordnung depr Datenblocke an die Daten- 
speichersysteme verteilen zu konn^n^. Fur den Fall 
■unterschiedlicher Zugrif f shauf igkeiten auf Daten- 
blocke ist dieser Punkt nicht automatisch durch 
Punkt 1 sichergestellt . 

3. f ehlertolerant sein, d. h. Ausfalle von Datenspei- 
chersystemen ohne Datenverlust uberstehen konnen. 
Die verlorenen Telle' sollten in moglichst kurzer 

' Zeit neu generiert werden konnen. 

4.. sicherstellen, dass bei -einer Hinzufugurig oder 
Wegnahme von Datenspeichersystemen nur moglichst 
wenige Datenblocke replatziert werden miissen, um- 
die oberen Punkte wieder herzustellen. Dieses 
sollte mdglichst ohne spurbare Beeintrachtigung des. 
laufenden Betriebs gescheheh, 

5. eine . kompakte Speicherung lind effiziente* Berechen- 
barkeit. der. Platzierung sicherstellen. 

Verfugt der Client nur uber unvollstandige Informatio- 
nen liber die Verteilung der Daten uber die- Datenspei- 



chersysteme, wie z. B. der Client voix Web-Caches, so 
muss zusatzlich der folgende Punkt unterstutzt werden: 

6. auch wehn der Client nur liber unvollstandige, bzw. 
falsche' inf ormationen uber den Aufbau des Speicher- 
systems verfUgt, muss die Datenplatzierungsstratfe- 
gie sicherstellen, dass eine hochst mogliche. i^zalil 
von Zugriffen auf das Speicher system erfolgreich 
ist, d. h. an einen.die Inf ormationen speichemden- 
Server . gestellt werde.n, 

Es. gibt im Wesentlichen zwei Standardstrategien fur die 
Speicherung von Daten iii Festplattensystem: 

1. die .Verwendung einer Zeigerstruktur , die ahnlich 
der . Verbindtmgsstruktur in Dateisystemen fiir klas- . 
sische Speichermedien (wie z, B. Festplatten und 
Disketten) arbeitet, oder 

2. die Verwendung eines virtuellen Adressraums, - der 
ahnlich eines virtuellen Adressraums in Rechnern : 
verwaltet wird,. 

Wir werden xins im Folgenden auf den * zweiten Punkt 
beschranken und annehmen, die Daten eines- Festplatten- 
systems werden in Form eipes virtuellen Adressraums 
gleichgroEer Datenblocke verwaltet.' Das Problem best eht 
also darin, eine geeignete Abbildung des virtuellen 
Adressraums auf die Festplatten zu finden. 

Die einfachste Art der Abbildung ist das so genannte ' 
Disk-Striping- ' [CPK95] , das in vielen Ansatzen in 
unterschiedlicher Granularitat verwendet wird [PGK88, 
TPBG93,. BBBM94, BHMM93, HG92, BGiyiiJ94, BGM95] Diese 
Methode hat eine weite Verbreitung in 



Festplattenf eldern (auch a'ls RAID- Arrays [RAID 
Redundant Array of Independent Disks] bezeichnet) 
erfahren, da viele der optionalen Platzierxingsihethoden 
(genannt: RAID-Level) auf Disk- Striping aufbauen. Beim 
Disk-Striping werden die Datenblocke des virtuellen 
Adressraums (oder Teilbldcke dieser Datenblocke) . zyk- 
lisch um die Festplatten gewickelt. Diese Strategie hat 
den Nachteil, d'ass ^sie sehr linflexibel bezuglich einer 
sich andemden Anzahl an^ Festplatten ist. Eine Ver- 
anderung vm lediglich eine Festplatte kann .eine fast 
vollstandige Neuverteiiung der Datenblocke erfordern. 
Aus dieseiti Gmnd ' sind heutige Festplattenf elder . nur 
schlecht skalierbar Ublicherweise werden daher* Fest- 
plattensysteme mit sehr vielen Festplatten in mehrere 
RAID-Arrays untergliedert . 

Die. Verwendung von zufalligen, Datenplatzierungen 
(mittels pseudo-zuf alliger Funktiorien) ist bereits von 
vielen Forschern als vielversprechende Alternatj.v- 
methode angesehen worden [AT97, B97 , SMB98, K97] . In 
dieser Technik werden den Datenblocken . zuf allig aus- 
gewahlte Festplatten zugewiesen. Zu deil ersteh, die 
zufallige Datenplatzierungsstrategien unt.ersucht haben, 
zahlen Mehlhorh iind Vishkin [MV83] . Insbesoiidere haben 
sie uritersucht, inwiefern mehrere zuf allig platzierte 
Kopien pro Datenblock helfen konnen., um Anfrageh 
gl'eichmalSig auf die Speichereinheiten zu verteilen. 
Weitere wichtige Resultate in dieser Richtung sind 
z. B. von Upfal and Wigderson. [UW87] und Karp, ■ Luby \ind 
Meyer auf der Heide [KIjM92] erzielt worden. 

.Birk [B97] hat ahnliche Datenabbildungs- und* -zugriffs- 
strategien vorgeschlagen,. aber er verwendet' eine 
Paxitatskodierung der Datenblocke. 



Weitere Arbeiten sind irnter anderem von Santos und 
Muntz im Rahmen des RIO Datenserver-Pro j ekts (RIO .= 
Remo.te* I/O) durchgefuhrt worden- [SMBSS, SM98] . Sie 
vergleichen die zufallige Platziemng mit traditionel- 
len . Striping-Methoden und zeigen, dass selbst in 
Situationen, fur die Disk-Striping entwickelt worden 
ist (reguiaire Zugrif f smuster) , die zufaildge Platzie- 
rung gleichwertig oder besser ist [SM98b] . Ihre zufal- 
lige Platziemng basiert auf einem zufalligen Muster 
fester GroSe. Falls die Anzahl der Datenbiacke diese 
GroSe libersteigt, dann wenden sie das Muster wiederhblt 
an, .um den gesamten Datenraum auf die Festplatten abzu- 
bilden. Das kann naturlich zu unangenehmen Koirrelatio- 
nen zwischen deii Datenblocken fuhren und eine Abwei- 
chung von der Gleichverteilung der Datenblocke und An- 
fragen verursachen. 

Bisher gibt es jedoch. nur wenige Ansatze, die in der 
Lage sind, die Anf orderungen an eine . ef f iziente, 
pseudo-randomisierte Datenplatzierung zu erfiillen. 
Besonders Schwierigkeiten ergeben sich dann, wenn 
heterogene, das heiSt verschieden groiSe Datenspeicher- 
systeme verweiidet werden oder wenn Datenspeichersysteme 
dynamisch in ein System eingefugt oder aus dem System 
. herausgenommen werden. 

Ein erster Ansatz, uiri Datenblocke dynamisch und ran- 
domisiert uber Datenspeichersysteme zu veipteilen, ' ist 
in [KLiL+97] vorgestellt worden. Dort werden (pseudo- 
) zufallige Funktionen verwendet, um den Datenblocken 
und Datenspeichersystemen zufallige reelle Punkte im 
Intervall [0,1] zuzuweisen. Ein Datenblock wird immer. 
von dem Datenspeichersystem gespeichert, dessen Punkt 



am nachsten am Punkt des Datenblocks ^,im [0 , 1] -Intervall 
iiegt. Der Vprteil dieser Strategie liegt darin, dass 

. sie einfach zu vierwalten ist und- sie nur die 
Replatziervmg einer erwartungsgemaS minimalen Anzahl an 

■ Blocken bei 'einer wechselnden ' Anzahl an Datenspeicher- 
systemen erfordert.. Sie hat allerdings den Nachteil, 
dass relativ hohe Schwankungen iim den Erwartungswert 
fut die Anzahl. der auf einem Datenspeichersystem zu 
speichernden Blocke und der zu replatzi^renden Blocke 
auftreten konnen und dass sie nur fur homogene Daten- 
speichersysteme effizient anwei^dbar ist. 

In [BBS99] vmrde ein Verfahren vorgestellt, das auch 
auf (pseudo-) zufalligen Funktionen auf baut . Die Daten- 
blocke werden wie auch in [KLL+97] mittels einer sol- 
chen FuiJction «auf zufallige Punkte im [0 , 1] -Intervall 
abgebildet. Aber die Zuordnung des [0, 1] -Intervalls auf. 
die Datenspeichersysteme . geschieht mittels einer fest 
vorgegebenen Abbildung, die Assimilierxingsf unktion ge- 
nannt wird. Diese Funktion sorgt dafiir, dass jede Fest- 
platte den gleichen Anteil des [0 , 1] -Intervalls zuge- 
wiesen bekommt.' Damit k^nn gewahrleistet werden, dass 
nicht nur die beputzten DatenblScke des virtuellen 
Adressraums sondera auch Ahfragen an diese Bl6cke 
gleichmaSig uber die Festplatten verteilt werden. kon- 
nen. Ein Vorteil dieses Verfahrens im Vergleich zu 
[KLL+98] liegt darin,. dass die As similierungs funktion 
die Daten mit wesentlich geringeren Abweichimgen von' 
der Gleichverteilung uber die Daten'speichersysteme ver- 
teilen kann. Wie die Strategie in [KLL+98] b'enotigt- 
diese Strategie nur die Replatzierung. einer erwartungs- 
gemafi minimalen Anzahl an Blocken "bei einer wechselnden 
Anzahl an Datenspeichersystemeh. Allerdings funktio- 
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niert sie wie die Strategie in [KLIi+98] nur gut fur 
homogene Sy s t eme . 

Da es haufig' aus Kostengrunden • nicht effizien}: ist, 
5 dass ein Speichersystem rein aus identischen Daten- 
speichersystemen. besteht, wurden in [BSSOO] auch 
Strategien fur nichtunif orme Datenspeichersysteme ent- 
wprfen. Diese basieren auf der in [BBS99] vorgestelltjen 
Strategie fur identische Datenspeichersysteme. Zunachst 
0 wird angenonunen, alle Systeme haben die gleiche 
Speicherkapazitat . Auf alle die Intervallteile, die 
liber die Kapazitat einer Datenspeichersysteme hinaus- 
gehen, wird dann in einer zweiten • Runde noch einmal die 
Strategie fur identische Festplatten angewandt, aller- 
15 dings diesmal nur auf die Datenspeichersysteme, die 
nach der ersten Platzierungsrunde noch freie Kapazita- 
. ten besitzen. Die dabei nicht unterzubringenden Inter- 
vallteile werden in einer weiteren Runde noch einmal 
platziert, usw. , bis das komplette [0, 1] -Intervall 
20. untergebracht ist. Der Hauptnachteil dieses Yerfahrens 
besteht darin, dass es Situationen gibt, in denen 
deutlich mehr an Daten umplatziert werden, als minimal 
notwendig. 

25 Die Aufgabe, die . durch' die Erfindung gelost werden 
soli, besteht dar in, ein Verfahren und eine Anordnung 
zur randomisierten Datenspeicherung in Speichemetzwer- 
ken und/oder einem Intranet und/oder dem Internet sowie 
ein entsprechendes Computerprogramm-Erzeugnis und ein 

3 0 . entsprechendes * computerlesbares Speichermedium bereit- 
zustellen, durch welche die vorstehend genannten Nach- 
telle behoben werden und ^^^besondere eine ef f ektive 
Behandlung von Speichernetzwerken, die heterogene 
Speichermedien umfassen, sowie eine dynamische. 
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Sl^alierung von Speichernetzwerken durch. Einfugen oder 
Herausnehmen von. Speichermedien gewalirleistet • wird . 

Diese Aufgabe wird erf indungsgemais gelost durch die 
Merkmale im .kennz^ichnenden Teil der. Anspirtiche 1, 15, 
23 und 24 im Zusammenwirken mit den Merkmalen im Ober- 
begriff . ZweckmSSige Ausgestaltungen der Erfindiing sind 
in .den Unteranspruchen enthalten. 

Ein besonderer Vorteil der Erfindiing liegt darin, dass 
durch das Verf ahren zur randomisierten DatenspeicherTong 
in Speichernetzwerken lind/oder einem Intranet und/oder 
dem Internet die Behandlung von Anderungen im Speicher- 
netzwerk ganz erheblich vereinfacht wird, indem eine 
Menge von Datenblocken Di (i=l, m) einer Menge von 

Datenspeichersystemen Sj (j=l, n) gemaS den 

folgenden Schritten. zugeordnet, und dort gespeichert 
wird: ' 

a) der Gesamtmenge der Datenspeichersysteme wird ein 
virtueller Speicherraum und jedem einzelhen Daten- 
speichersystem S-j ( j=i, , n) . durch einen ersten 
Zuf allsprozeS mindestens ein Teilraum Ij des vir- 
tuellen Speicherraiims zugeordnet, wobei das Ver- 
haltnis zwisch^n dem Teilraum Ij und dem gesamten 
virtuellen Speicherraum wenigstens naherungsweise 
dem Verhaltnis der auf das Datenspeichersystem Sj 
bzw. aiif die Gesamtmenge der Datenspeichersy^teme 
bezogenen Werte eines vorgebbaren Parameters 
entspricht, 

b) jedem Datenblock Di (i=l, m) wird durch einen 
• zweiten ZufallsprozeS ein (zufalliges) Element . h (i) 

des virtuellen Speicherrauiris zugeordnet, 

c) , fiir jeden Datenblock Di . (i=l, m) wird minde- 

stens ein Teilraum .Ik ermittelt, in dem h,(i) ent- 
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halten ist, und der Datenblock Di mindestens einem 
det durch diese.(n) Teilraume (Teilrauxn) repra- 
sentierten Datenspeichersystem , zugeordnet xind 
dort gespeichert. 

* ' ' ■ 

Eine Anordnung zur randomisierten Datenspeicherung in 
SpeiGhernetzwerken xind/oder einem Intranet und/oder d6m 
Internet, ist vorteilhaf terweise so feirigerichtet, daS 
sie mindestens einen Prozessor umfaSt, der (die) derart 
eingerichtet ist (sind) , dafi ein -Verfahren zur 
randomisierten Datenspeicherung in' Speichemetzwerken ' 
und/oder einem Intranet und/oder dem Internet durch- 
fuhrbar ist, wobei. die . randomisierte Datenspeicherung 
die Verfahrensschritte gematS einem der Anspriiche 1 bis 
14 TimfaSt. 

Ein Computerprogrammprodukt zur . randomisierten/ Daten- 
speicherung in Speichernetzwerkfen und/oder einem Intra- 
net und/oder dem Internet umfaSt ein computerl^sbares 
Speichermedium, auf dem ein Programrri gespeichert ist, 
das es einem Computer erm6glicht> nachdem es in" den 
Speichef des Computers geladen worden .ist, ein Ver- 
fahren zur randomisierten Datenspeicherung in Speicher- ' 
net2;werken und/oder einem Intranet W/oder dem Inter- 
net durchzufuhren, wobei die randomisierte Datenspei- 
cherung di^ Verfahrensschritte. gemafi einem der An-' 
spriiche 1 bis 1,4 umfalSt. 

Urn eine randomisierte Datenspeiclaerung in Speichernetz- ' 
werken und/oder einem Intranet ivid/oder dem Internet 
durchzufiihren, wird vorteilhaf terweise ein computerles- 
bares Speichermedium eingesetzt, auf dem ein Ptogramm- 
gespeichert ist, das es einem Computer., ermoglicht," 
nachdem es in den Speicher des Computers geladen worden 
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.ist, ein Verfaliren zur randomisierten Datenspeicherung 
in Speicheraetzwerken \ind/6der einem Intranet und/oder 
dem Internet durchzufuhren,. wobei die randomisierte 
Datenspeichening die Verf ahrensschritte gemas einem der 
Ansprflche 1 bis . 14 umf afit : 



25 



30 



In einer bevorzugten Ausfiihrungsf orm des erf indungs- 
gemalSen Verfabrens ist vorgesehen, dass bei dem ersten 
und/oder zweiten Zuf allsprozelS, pseudo-zuf ailige 
Funktionen angewendet werden. ' • 
Als ein weiterer Vorteil erweist es. sich; wenn Daten- 
speichersysteme Sj , deren Wert cj des vorgebbaren Para- 
meters einen ebenfalls vorgebbaren zweiten Wert 5 Qber-' 

steigt, in 



neue virtuelle Datenspeichersysteme, Sj 



15 mit 



Cj. =5 mid - falls 



6 0 - 



m ein 



weiteres virtuelles Datenspeichersystem Sk.mit = cj - 

* 5 zerlegt werden und diesen. virtuellen Daten- 

speichersystemen durch den ersten Zuf allsprozeS jeweils 
mindesteng ein Teilraum Ij. bzw. .des virtuellen 

Speicherraums zugeordnet wird, wobei [aj den g^zzah- 
ligen Anteil einer Zabl a e IR beschreibt. 
Des weiteren ist es von. Vorteil, . wenn der virtuelle 
Speicherraum . durch das Intervall [0,1) und die Teil- 
raume Ij durch mindestens ein in [0,1) enthaltenes 
Teilintervall r^prSsentiert wejr'den und im ersten Zu- 
f allsprozeS durch die Anwendung einer ersten Hash- 
Funktion g(j) der links Rand des Intervalls I^ ermit- 
telt und die LSnge des Intervalls gemaS (^(j} +3 * cj) 
berechnet wird, mit: ... 

Cjt Wert des auf das Datenspeichersystem Sj bezogenen 
Parameters und 
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s: . Stretch- Fakto.r/ der so . gewahlt ist, daS s * Cj < 1 

. erfullt i'st. . . ' ' 

Von Vorteil ist. es dabei, wenn der Stretch-Faktor s 
derart gewahlt wird, dass das Intervall [0,1) vollstan- 
dig durch die . Teilintervalle Ij ub.erdeckt wird. ' 
Im zweiten Zuf allsproz,eS wird vorteilhaf terweise durch 
die Anwendiing einer zweiten Hash-Fiinkt'ion hCi) jedem 
Datenblock D± (i=l, eine^ Zahl h(i) *e. [0,1) 

. zugeordnet . . • ' 

In einer. bevorzugten Ausfuhrungsf orm des Verfahrens zur. 
randomisierten ' Datenspeicliening ist vorgesehen,. dass 
der vorgebbare Par^eter die physikalische Kapazitat 
von Datenspeichersystemen oder die Anfragelast von 
Datenspeichersystemen beschreibt oder Abweichiingen von 
der gewu^schten Vert ei lung korrigieren. 

In d^m Fall, dass das einem Datenblock Di zugeordnete 
Element h(i) in mehreren Teilraumen Ij enthalten ist, 
erweist es sich als vorteilhaf t, dass eine uniforme 
Platzierungsstrategie angewendet wird, um den Daten- 
block Di einem der durch die Teilraume Ij reprasen- 
tierten Datenspeichersystem zuzuordnen. 

Daruber hinaus ist es von Vorteil, dass bei Anderungen 
mindestens , eines der Werte C= (ci, . . • , Cn) des vorgeb- 
baren. Parameters eine erneute Zuordniing der Datenblocke 
Di zu den Datenspeichersystemen - Sj iiach dem Veirfahren 
zur randomisierten Datenspeicherung gemalS einem der An- 
spruche 1 bi.s 9 unter Zugrundelegung der neuen Para- 
meterwerte C'-(cx', Cn*) erfolgt,. 

In bestimmten • Fallen kann es' nutzlich ' sein, bei nur 
geringen Anderungen von ' Werten des vorgebbaren Para^ 
meters keine Neuverteilung der. Datenblocke vorzunehmen. 
Dies wird erreicht, indem bei Anderungen mindestens 
eines der Werte C= (ci, . - • , Cn) des vorgebbaren Para- 
meters eine erneute Zuordnung der Datenblocke Di zu den 



Datenspeichersystemen Sj nach dem Verfahren zur rando- 
misiert^n Datenspeichervmg gemaB einem der Anspruche 1 
bis 9 unter • Zugrxindelegung der neuen Parameterwerte 
^'-(<^i'f Qn'). nur erfolgt, wenn ein neuen Para- 

meterwert Ci- sich von dem entspredhenderi • aktuellen 
•Parameterwert Ci um einen vorgebbaren Wert n xinter- 
scheidet. 

Bei groSen Anderungen des vorgebbaren Parameters 
, wiederum werden Anpassxangen des Systems votteilhaf ter- 
weise .vorgenommen, indem bei Anderungen mindestens 
eines ■ der Werte C= (a, . . . , a J des vorgebbaren 
Parameters in einen neuen Parameterwert C'=(cx', 
Cn') stufenweise eine emeute Zuordliung der. Datenblocke 
Di zu den Datenspeichersystemen Sj nach. dem Verfahren 
zur randomisierten Datenspeicherung gemaE einem der 
Anspruche 1 bis 9 erfolgt, wobei in jeder Stufe k 
Zwischen- Parameterwerte C*= (c^.^, c^J mit | Ci - | 

S" \ci - c'i| (± = 1, n) zugrvmdegelegt werden. 

Dieses Vorgehen hat den grolSen Vorteil, dass das System 
im Gegensatz zu . einem direktpri Update wesentlich 
schneller aiif hohe Anf ragebelastungen oder eine neue, 
vom Administrator gewahlte Kapazitatsverteilung c ' 
reagieren kann, da in jedem der Dbergangsprozess vori 
C nach C abgebrochen werden kann. 

DarOber hinaius ist es von • Vorteil, ' dass zur 
Abspeicheriing der Datenbl6cke in ^inem Speichermedium 
mindestens eine Tabfelle bereitgestellt wird, in denen 
die Zuordnung zwischen virtueller Adresse xmd 
physikalischer Adresse ' auf dem Speichermedium abge- 
speichert ist. 

Ein. weiterer Vorteil des erf indungsgemaSen Verf ahrens . 
zur randomisierten Datenspeicherung besteht dairin, dass 
mehrere' Datenblocke zu einem Extent ■ zusammengef asst 
werden, denen in der Tabelle eine gemeinsame physika- 
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lische Adresse auf dem Speichermedium ziigeordnet wird, 
wobei die Datenblocke ' eines Extents im Ibgisqheri 
Adressraum miteinandeir verbimden sind, indem der erste 
Datenbloclc eines aus 2^ Datenblocken bestehenden 
5 Extents eine Adresse der Form xp0...000 erhalt, wobei 
die unteren A Bits Null sind, der' letzte Block dieses. 
Extents die Adresse xll ... Ill . erhalt , wobei die unter- 
sten A Bits Eins sind, und die physikalische Position 
eines Datenblocks durch eine Addition des Tabellen- 
10 eintrags fur den zugehorigen Extent mit den letzten A 
Bits* der logischen Adresse des Datenblocks gewonnen 
wird.. Durch dieses Vorgehen wird die Anzahl .von zu 
sichernden Tabelleneintragen reduziert. ' 

15 in einer .bevorzugten Ausfuhrungsf orm der Er-f indung ist 
verges ehen, das's die Anordnung mindestens einem Da ten - 
speichersystem und/oder mindestens einem Computer- 
system, das (die) lesend und/oder schreibend auf die 
• Speichermedi<sii zugreif t , (zugreif en) , und/oder minde- 
20 .. stens eine zwischen das (die) Computersystem (e) und das 
(die) . Datenspeichersystem (e) geschaltete Kontroller- 
Einh-eit zur Steuerung des Verfahrens randomisierten 
Datenspeicherung ' iimf asst . Die Datenspeichersysteme 
. umf assen dabei vorteilhaf terweise Festplattenf elder 
25 und/oder als Web-Cashes ausgebildete Zwischenspeicher . 
Weiterhin stellt. es sich als vorteilhaft heraus, wenn 
die Anordniing mindestens eine zwischen d,as (die) Com- 
putersystem (e) und das (die) Datenspeichersystem (e) ger 
schaltete Kont roller- Einheit zur Steuerung des .Ver- 
3 0 fahrens zur -randomisierten Datenspeicherung. umf asst.. 
Dabei kann es sich als nutzlich erweisen, dass das Ver- 
fahren zur randomisierten Datenspeicherimg als Hard- 
ware -RAID- Verfahren in der Kontroller-Einheit implemen- 
tiert ist . 
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In einer weiteren bevorzugten Ausf lihrungs.f onti der Er- 
findiing ist vorgesehen, dass die Anordniing mindestens 
ein dediziertes, liber Mittel ztun Datenaust'ausch mit 
Speichermedien unA Computersyatemen der Anordnung ver- 
bundenies Computer system (SAN- Appliance) zur Koordina- 
tion der, Datenspeicherung und/oder uber Mittel z\im 
Datenaustausch mit Speichermedien ". und Computersystemen 
der Anordnung v^rbundene Rechenressourcen (In-Band- 
Appliances) zur Verteilung der DatenblScke umfasst. * 
Ebenso stellt es einen Vorteil dar dass .die Anordnung 
heterogene Speichermedien umfasst. ' ' - 

- Die Erf indung " soil nachstehend anhand von zumindest 
teilweise in den Fignren dargestellten Ausfuhrungs- 
.beispielen riaher erlautert werden, • 

Es zeigen: 

Fig. 1 Aufbau eines Speichernetzwerkes, 

Fig. 2 Veranschaulichung der Out-of-Band Virtuali-* 

sierung des Datenraums/ 
Fig. 3 Veranschaulichung der In-Band Virtuali- 

sierung. 

Fig. 4 Aufteilung der virtuellen Adresse- eines 
Datenblocks zur Bestimmung der zugehorigen 
. Festplatte und des zugehorigen Metablocks . 

Wie aus dem Ahf orderungsprof il an' die Datenverwaltungs- 
strategie ersichtlich w±Td, ist die Losung der Aufga- 
benstellung im Allgemeinen davon abhangig, ob die an 
ein System angeschlossenen Clients 3 uber alle fur die 
Datenverteilung notwendigen Inf ormationen verfugen. Im 
Folgenden w±rd das erf indungsgemage Verfahren, welches- 
nachfolgend als Share- Strategie bezeichnet ^ wird, 
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vorgestellt,. welches in der Lage ist, in beideh Fallen 
nahezu optimale Verteilungs- und Zugrif f seigehschaf ten 
zu garantieren.. 

5 Nachfolgend werden kurz Voraussetzungen und Definitio- 
nen vorgestellt, die bei der Beschreibting des Ausfilh- 
rungsbeispiels benutzt werden. i. 

Die Anzahl der iii einefti System zu speichemden Da^ten- 
.10. blocke wird mit m, ■ die Anzahl der maximal verwendbaren 
f. ■ Datenspeichiersysteme mit . N bezeichnet. N wird dabei 

durch die Datenplatzierungsstrategie vorgegeben vind ist 

nicht von der' aktuellen Anzahl \and GroSe der Daten--. 

speichersysteme abhangig. Die Anzahl der in dem System 
15 tatsachlich verfugbaren Datenspeichersysteme wird mit n 

bezeichnet. Fur. den Fall, dass die Anzahl der von den 

Datenspeichersystemen speicherbaren Datenblocke kleiner 
• alsjn ist, ist es erf orderlich, dass ein weiteres Speir 

chersystem zur Verfugimg gestellt wird, in das aktuell 
.20 nicht abbildbare Datenblocke ausgelagert werden konnen. 

•Der Anteil der Datenbldcke, die von einem .Datenspei- 
chersystem i gespeichert werden konnen, wird als' rela.- 
tive Kapazxtiit ci e. [0,1] bezeichnet, wob'ei Si ci = 1, 
25 Die GroSe der individuellen ci kann dabei von verschie- 
denen Faktoren . abhangen, so z. B. von der Speicher- 
kapazitat, wenh es sich um eine Festplatte handelt, 
Oder von der Bandbreite der angesghlossenen Verbin- 
dungen bei eineirt Web-Cache. Zielsetzung einer Daten- 
platzierungsstrategie sollte es sein, dass auf jedem 
Datenspeichersystem 1 bei m zu platzierenden Daten- 
blocken Ci * m Datenblocke gespeichert werden. Bei der 
Beschreibiang der umzusetzenden . Techniken wird nicht 
davbn ausgegangen, dass sich die Anzahl der Datenspei- 



30 



20 



.chersysteme In. dem System yerandert . Diese Situation- 
• kann dadurch mpdelliert warden, dass die relative 
Kapazitat ci eines Datenspeichersystems i, das sich zum 
, Zeitpiinkt t nicht in dem System befindet, zu- diesem 
5 Zeitpiinkt auf Null gesetzt wird. / ' . 

Die Aufgabe der Datenverteilungsstrategie kann nun in 
zwei Aufgabenpunkte Tuntergliedert werden. In eihem er- 
sten Schritt muss ein Datenblock mit seiner virtuellen 

10 Adresse einem Datenspeichersystem zugeordnet werde^. 
Diese Zuordnimg wird im Folgenden auch als glgbale 
,Datenverteilung- bezeichnet. In einem zweiten Schritt 
muss der Datenblock nicht nur eihem Datenspeicher- 
system, sondern zusatzlich auch einer Position auf 

15 diesem Datenspeichersystem zugeordnet werden. Diese Zu- 
ordnung wird im Folgenden auch als lokale Daten- 
verteilungr bezeichnet. Die Erfindung beschaftigt sich 
mit dem Problem der globalen Datenverteilung . Im Rahmen 
der Beschreibung des erf indxingsgemafien Verfahrens wer- 

20 den kurz einfache lokale • Datenverteilungsstrategien 
vorgestellt, die unsere neuen giobalen Datenvertei- 
, lungsstrategien ergSnzen. 

Eine Voraussetzung fUr den Einsatz der Share-Strategie 
25 ist^es,. dass sie als Subroutine eine^ Ftinktion verwenden • 
kann, die das. Problem der Datenverteilung fur im i forme 
Datenspeichersysteme lost, d. h. fur den Fail, dass ci 
.= Xi alle i. M6gliche Strategien fur den \miformen. 

Fall sind in [KLL+97] und [BBS.OO] vorgestellt worden. 
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Die Share-Strategie wird niin" im Detail beschrieben: In 
Share werden jedem Speichersystem ein Oder mehrere 
.Intervalle zugeordnet, deren Gesamtgrofie der relativen 
Kapazitat des Systems entspricht . Diese Intervalle 
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werden auf ein [0, 1) -Intervall abgebildet, 'konnen sich 
.abe-r im Gegensatz zu fruheren Strategien mit anderen 
. Intervallen liberlappen* Jedem Datenblock wird - nun 
mittels einer (pseudo- ) 2uf alligen Funktion ein reeller 
5 Punkt im [0^ 1) -Intervall zugewiesen. Dieser Piinkt kann 
eventuell zu .raehreren InterVallen vbn Speichersystemen 
• gehoren.- Falls , dem so ist, wird eine xiniforme 
Piatzierungsstrategie veirwendet, um den . Datenblock 
einem dieser Speicliersysteme zuzuweisen. Verandem. sich 
0 nun die relativen- Kapazitaten der Speichersysteme, so . 
werden die Intervalliangen entsprechend angepassjt. 

Im Folgenden werden wir zunachst eine detaillierte Be- 
schreibung der Share-Strategie geben xirid anschlieSend 
15 darlegen, warum sie . anderen Strategien uberlegen ist. 

.Die von der Share -Strategic verwendete Strategic fur 
uniforme Datenspeichersysteme wird im Folgenden als 
Unif 02nn(b, S) bezeichnet, wobei b dies virtuelle Adresse 
2 0 des Datenblocks ^ iind ' S die Menge der Datenspeicherv . 
systeme beschreibt . Die Ruckgabe der Funktion lief ert 
das I Datenspeicher system, auf das der Datenblock Jb 
platziert wird. 

25 Die Share- Strategic basiert auf zwei zusatzlichen Hash- 
•Funktionen, die neben den moglicherWeise fur die uni- 
forme Strategic verwendeten Hash-Punkfcionen bereitge- 
stellt werden * mussen. Die Hash-Funktion h: 
{l, . . .,m} — > [0,1) vcrtcilt die Datcnblockc pseudo- 

30' zufallig ubcr das Intervall [0,1). Eine weitcrc Hash-. 
Funktion g: (l, . . . , n} — > [0,1) ordnct * den beteiligten 
Datcnspeichersystcmen einen Pxinkt in dem Intervall 
[0,1) zu. Weiterhin werden. die Parameter s, S ^ [l/JW, 1] 
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verwendet, deren Bedeutung / im weiteren Verlauf 
erlautert wird. \ 

Es . wir:d angenommen, dass n Datenspeichersysteme mit 
(ci, . • . > Cn) e [0,1)^.' gegeben sind.- Es wird ^ dann die 
folgende .'Strategie verwendet : Fur jedes Datenspeicher- 



system mit Ci > 5 werderf 



neue virfc.uelle Datenspei- 



mit Cj =' Ci - 



* ' 6 eingefugt . Datenspeichersysteme, 



chersysteme i' mit cii =5 eingefugt. Entspricht die 
Sunime der relativen Kapazitaten der virtuellen Daten- 
speichersysteme nicht der ursprunglichen Kapazitat, 
wird ein zusatzliches virtuelles Datenspeichersystem j 

deren Demand kleiner als S sind, werden in ihrer 
ursprunglichen Form . belasseh und als einzelne, vir- 
15* ' tuelle Datenspeichersysteme angesehen. Durch die 
Transformation der Datenspeichersysteme Werden maximal 
n» ^ n + 1/5 virtuelle Datenspeichersyi^teme erzeugt. 

Jedem virtuellen. Datenspeichersystem i wird • nun ein 
2 0 Intervall Ii der .Lange s * Ci zugeordnet, das von g(i) 
bis (g(i) + s * ci^modl reicht, Der [0, 1) -Bereiqh wird 
also als Ring angesehen, um den die einzelnen Inter- 
valle gewickelt werden. Die Konstante s wird als 
Stretch-Faktor bezeichnet. Um zu verhindern, dass ein 
25 einzelnes Intervall mehrfach um den Ring, gewickelt 
wird, sollte b < ]/ gewahlt werden. Ein h > ]/ ist 
moglich, erschwert jedach die Umsetzung des Verfahrens. 

Fur jedes x g [0,1) sei Cx =• fi; x ^ Ji} .die Menge der 
30 Intervalle, in denen x enthalten ist. Die Anzahl d^r 
Elemente Cx = ICxI in dieser Menge Wird als Contention 
bezeichnet. Da die Anzahl der Endpunkte der Intervalle 



der virtueilen Datenspeichersysteme maximal 

2xi' < 2 (n + betragt, wird das • [0, 1) -Intervall in 

maximal 2 (n + Rahmen . [0,1). aufgeteilt, so 

das s 'fur jeden Rahmen Fj die Menge fur jedes x 
identisch' ist . Die Beschrankung der Anzahl der Rahmen 
ist wichtig, um die' GrolSe der Datenstriikturen . f ur die 
Share rStrategie zu begrenzen. , . ' . 

Die Berechnung des zu einem Datenblock zugehorigen 
Datenspeichersystems erf olgt nun durch den Auf ruf : • 
Uniform (b, Cii(b)) • 

Ein wichtiger Vorteil der Erf indung besteht wie erwahnt 
darin, daS sie die Behandlung von Anderungen im Spei- 
chernetzwerk 1 in auSerst einfacher Weise gestattet.. «Je 
nach. Anforderung kann es sich dabei als sinnyoll 
erweisen, . auf sich andernde Umgebungen mit einer 
Adaption der Share- Strategic zu reagieren. 

Bisher wurde erlaiitert, wie die Platzierung von Daten- 
blocken in einem statischen System vorzunehmen. ist: Es 
wird nun angenommen/ dass sich die Verteilung der 
relativen Kapazitaten 'in dem System von C=Yci, . . ^n) 
auf C'=(ci', Cn) verandert. Wie' oben erlautert, 

umfiasst dieses auch den Fall, dass neue Datenspeicher- 
systeme in das System eintreten, bzw. Datenspeicher- 
systeme das System verlassen. Es sind jiun verschiedene 
Varianten denkbar, um einen Ubergang von C nach C 
vorzunehmen. ' *\ 

Var iante 1 : Direct Update 

Die einf achste Methode besteht darin, direkt von C nach 
C" uberzugehen und die entsprechendep. Umplatzierungen 
vorzunehmen. Das hat den Nachteil, dass selbst bei 
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kleinsten Veranderungeri wegen der Verwendung pseudo- 
zufalliger Furxktionen eventuell Umplatzierungen von 
mehreren Datenblocken vprgenommen werden mussen, imd 
bei groSen Veranderungen das System sich lange in einem 
Dbergangszustand befindet, . was die, Auf rechterhaltung 
des oben genannten -vierten Punktes dei: Anf orderuiigen an 
Datenverwaltimgsstrategien gefahrden kann. 

Variant e 2: Lazy Update! 

Im Folgenden wird eine Strategic vorgestellt, die dafur 
sorgt,. dass bei sehr geringen Kapazitatsveranderungen 
keine Daten umzuvert^ilen .sind. 

Sei 0 < p. < 1 eine feste Konstante, die als Tragheit 
der Share7Strategie bezeichnet wird. Die ^ Share- 
, Strategic . andert . die relative ' Kapazitat. eines 
Datenspeichersystems .1 nur dann von ci auf ci', wenn 
Ci' > (1 + M.)'Ci Oder ci' < (1 - li)c:±. Hicrdurch kann die 
Summe der relativen Kapazitaten uber alle 
Datenspeichersysteme von 1 abweichen, bleibt jedoch im 
Bereich : yon 1 \± \x„ so dass bei kleinem die 
Eigenschaf ten der Share -Strategic nicht gefahrdet sind. 

Variant e 3: Smooth Update • . 

Diese Variante ist sinnvoll fur den Fall groSer Kapazi- 
tat sanderungen. Falls C \ind C* grofie Kapazitats- 
abweichungen haben, werden zunachst Zwischenstuf en 
Ci, C2/ C3,...,Ct berechnet, so dass mit C=Co. und C ' =Ct+i 
fur jedes i in {O, . . ..,t} Ci imd Ci+i eng. genug beisanunen 
liegen, dass es dem System moglich ist, schnell von der 
einen zur , anderen Kapazitatsverteilung und damit in 
einen stabilen Zustand uberzugehen. Dieser Prozess hat 
den grofien Vorteil, dass das System im Gegensatz zum 
Direct Upidate wesentlich schneller • auf hohe 



Anf ragebelastungen oder sine neu vom Administrator 
gewahlte Kapazitatsverteilung C ' reagieren kaim, da ifi 
jedem Ci der Ubergangsprozess voii G nach C abgebrochen 
werden kann. 

Konkrete Umsetzungen der Verfahren werden in der 
weiteren . Beschrieibung ■ erlautert . 

Walil der Kapazitaten: 

Die Wahl der Kapa.zitaten fur Share muss sic*h nicht not- 
wendigeirweise nacii der physikalischen Kapazitat eines 
Speichersystems richten. Da Share beliebige Kapazitats- 
verteilungen zulasst, konnen die Share-Kapazitaten auch 
dazu benutizt werden, vm eine bessere Balancierung der 
Anfragelast vorzunehmen, urn zum Beispiel Engpasse in 
den Verbindungen zu Speichersystemen oder in den 
Speichersystemen selbst zu beseitigen. t)es Weiteren 
konnen sie benutzt werden, um Abweichiingen von der 
gewunschten 'Verteilimg (die wegen der Verwendung 
pseudo- zuf alliger Hash'-Funktionen nicht auszuschlielSen 
sind) auszugleichen. Die Share Strategie 'erlaubt also 
eine hohe Flexibilitat in der Verteilung der Daten xind 
eine hohe Robustheit, und . erfullt damit wichtige 
Anf orderxingen an ein Speichersystem. 

Nachfolgend werden ndch einige spezielle Aspekte des 
erf indungsgemafien Verfahrens erlautert: 

1. Abdeckung des [0 , 1) -Intervalls 

Damit . ' sichergestellt werden kann, dass die Share- 
Strategie jedem Datenpunkt :ein Datenspeichersystem zu- 
weisen kann, muss das [0 , 1) -Interval! vollst^ndig durch 



die Intervalle der virtu^llen . D'atenspeichersysteme ab- 
gedeckt warden. Dieses kaiin bereits durch die Hash^- 
Funktion gr sichergestellt sein,. indem nach der Vertei- 
lung der Intervalle der batenspeictiersysteme. die Ab- 
deckung ilberpruf.t wird imd gegebenetif alls einzelne 
Intisrvalle verschpben werden. Bei einer zufalligen 
Platzierung der Intervalle' durch eine pseudb- random! - 
sierte Hash- Fiinkt ion h ist es jedoch ausreichend, einen 
Stretch-Faktor s = Jc * In zi mit k > 3 zu verwenden, so 
dass mit hoher Wahrscheinlichkeit die Interyalle der 
Datenspeicher ' Systeme das [0 , 1) -Intervall ' abdecken. 
Hohe Wahrscheinlichkeit bedeutet hier, dass die 
Wahrscheinlichkeit, dass. e.in Be.reich nicht abgedeckt 
wird, kleiner als ' ^ ist. Ergibt die Kontrolle der 

Verteilung der Intervalle/ dass riicht jeder Punkt des 
[0, 1) -Interval Is abgedeckt ist, so kann die Abdeckxing 
durch eine Adaption des Stretch- F;akt or s erfolgeh. 

2 . Benotigter Speicherplatz ui}.d Rechenkomplexitat 

Wird die in [KIjL+97] vorgestellte . Strategie als 
hompgene Datenplatzierungsstrategie Uniform (b,S) 

ve'rwendet, so- liegt die erwartete Zeit, das zu einem 
Dateiiblock ziigehorige Datenspeicher system zu berechhen, 
in 0(1). Die Speicherkomplexitat zur Berechnung der 
Share -ptrategie liegt in 0(8 * k * .^(n + Nicht 

mitgezahlt sind hier die* Speicher- und Berechnungs- 
komplexitat der verwendetien Hash-Funktionen. 

3 . Giite der Verteilung 

Werden pseudo-randomisierte Hash-Funktionen yerwendet 
und wird ein Stretch-Faktor s > 6 lii{N/a^) .mit 
a =s s/{l + . s) gewS-hlt, so. bewegt sich der Anteil der 
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Datenblocke, die von . einem Datenspeicher systems i 
gespeichert werden, mit hoher Wahrscheinlichkei,t in dem. 
Bereich Si e ■ [(1 .- ^)di/ (1 - ^) dj . 

5. In den fblgenden Abschnitten wird dargestellt, wie der 
Aufbau von Datenspeichersystemen mit Hilf e ' der Share- 
Strategie effizient durchgef uhrt warden kann. Es wird 
darauf hingewiesen/ dass es sich dabei .lediglich urn. 
Implementieriingsbeispiele handelt. In einem ersten 

0 Schritt wird vorgestellt, wie die Fuiiktionalitat in ein 
allgemeines RAID-System integriert werden kann: 

Integration der Share -Strategie in. ein allgemeines 
RAID- System: 
15 . • 

Die Share -Strategie fcann verwendet werden, urn in 
Systemen, die aus einer Menge von . Speichermedien/ aus 
mehreren Computersystemen und eine;r Kontroller-Einheit 
bestehen, Festplattenf elder aufzubauen. Dabei kann die 

2 0 Share- Strategie sowphl in dem angeschlossenen Computer- 
systemen als Software -RAID Yerf ahren integriert werden, 
als auch in der Kontroller-Einheit als Hardware-RAID 
Verf ahren. Die Share- Strategie ist dabei fur die Zuord- 
nung der Datenblocke liber die Festplatten zustandig, 

25 die Zuordnung des Datenblocks zu einer physikalischen 
Adresse auf der Festplatte wird von einer . unter der 
. Share -Strategie liegendeii Strategie ubernoramen. Eine 
Moglichkeit fur die Zuordnung der physikalischen Posi- 
. tion besteht in der Bereitstellung von Tabellen, in 

3 0 denen eine Zuordnung zwischen virtueller Adresse und 

physikalisGher Adresse auf der Festplatte abgespeichert 
wird . 
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Es ist- dabei moglich, die. Aazalil. der zu sichernderi 
Tabelleneintrage zu reduzieren, indem nicht. jedem^ 
elnzelnen Datenblock ein eigener Eintrag zugeordnet 
wird, sohdern indem Blockmengen minimaler Grofie, im 
5 Folgenden auch als Extents Ipezbichnet, uber einen 
. gemeinsamen Eintrag in der Tabelle verf ugen.. Bei einem 
Extent handelt es sich urn eine Menge von Blocken, die 
in dem logischen Adressraum miteinander verbunden sind. 
Ein Extent besteht aus 2^ B16cken. Der erste Block des 

• 0- Extents hat eine Adiresse der Form xOO . . ,000, wobei die 
unteren A Bits 7 durch die Zif f er Null reprasentiert 
sind. Der letzte Block des Extents hat die Adresse 
xll . . .111, wobei die uritersten. A . Bits 7 durch . die 
Ziffer Eins reprasentiert sind. Die physikalische 
15 Position eines. Datenblocks wi'rd durch .eine Addition des 
• Tabelleneintrags . fur den zugehorigen Extent mit den 
unteren A* Bits 7 der logischen Adresse des Datenblocks 
gewonnen. Hat jeder Tabellerieintrag die Foirni yOoi . ,000, 
. d. h. die unteren A -Bits 7 werden Null gesetzt, kaim 
'20* die Additipn durch eine einfache ODER-Verknupfung 
durchgefuhrt werden. Die oberen Bits 6 der virtuellen 
Adresse eines Datenblocks dienen also zur Berechnung ' 
des zugeordneten Speichermediiuns und. der Bestimmung des 
Tabelleneint^rages fxir den Extent, die unteren Bits 7 . 
' 25 dienen als Offset innerhalb des Extents.. Allen Daten- 
blocken, die uber gemeinsame obere Bits 6 verfugen, 
wird ein Tabelleneintrag zugeordnet. Dieser Tabel- 
leneintrag kann z. B. an der Stelle gespeichert werden, 
an der auch die Berechnung der Share -Strategie durch- 
3 0 gefuhrt wird* 

integration der Share -strategie in ein Speichemetzwerk 1: 
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Die Integration der globalen DatenverteiT-ungsstrategien 
in ein Speichernetzwerk 1 geht von einer Struktur gemaS 
Figur 1 aus,. Das Gesamt system besteht aus einer Mengei 
von Datei- ■ Oder* Datenbankserverri, im Folgenden als 
5 Computersysteme bezeichnet , die uber ein Speichernetz- 
werk 1 an * Datenspeichersysteme 4 angeschlossen sind. 
■ Das Speicheirnetzwerk 1 . \imf alSt weiter eine. Menge von 
Switches bzw. Routern 2, die die Zustellting der Daten- 
pakete zwischen kommtinizierenden Einheiten sicherstel- 
10 len. Die Computersysteme sind in dem hier vorliegenden 
Kbntext als Clients 3 zu betrachten, die von den Daten- 
. speichersystemen 4 Blocke lesen, oder auf den Daten-. 
speichersystemen 4 Datenblocke schreiben. Mit Hilfe der 
Share -Strategic kann jede beliebige T.eilmenge M der an 
15 das Speichernetzwerk 1 angeschlossenen Speichersysteitie 
4 wie ein einziger logischer Speicherpool verwaltet 
werden, der uber einen linearen Adressraum verf ugt • Die 
Menge der Speichersysteme 4 kann dabei in mehrere 
kleinere oder einen groSen ' Speicherpool aufgeteilt 
20 werden, wobei keine ^ der Speichersysteme 4 mehr als 
einem Speicherpool zugeordnet werden sollte. Es wird im 
Folgenden nur der Fall betrachtet, dass das System aus 
einem Speicherpool besteht , ' * 

25 Aus einem Speicherpool kpnnen mehrere virtuelle Spei- 
chersysteme aufgebaut werden, wobei jedes dieser vir- 
tuellen Speichersysteme gemaS der Share -Strategie ver- 
waltet wird. Besteht ein Speicherpool aus einer 
Teilmenge M der Speichersysteme, so erfolgt der Aufruf 

•30 der Share-Strategie fur die logischen Speichersysteme 
gem^S der gesamt en Teilmenge M. Jedem virtuellen Spei- 
chersystem wird eine Speicher- Policy zugeordnet die 
Eigenschaf ten wie physikalische Blockgrofie und Red\in- 
danz umfasst.. Diese Zuordnung kann separat fur jedes 



virtuelle Speichersystem oder eirunal fiir den gesamten 
Speicherpool .erf blgen. . Nachdem Daten auf^ eine virtuelle 
Pestplatte geschrieben wurden^ kann die Speicher-Policy 
im Allgemeinen nicht mehr verandert warden. 

Wird .von einem Compute.r system .auf einen Extent ,zuge- 
grif f en, d6r bisher von dem Computersystem noch nicht 
verwendet wurde und fur den kein Tabelleneintrag in 
diesem Computersystem vorliegt, muss ein neuer Tabel- 
leneintrag allokiert' werden. Die Allokation kann auf 
zwei. Arten erfolgeii: 

1 . Das Computersystem -f ragt bei einer zentralen In- 
stanz, die uber globales Wissen uber alle Tabel- 
leneintrage verfugt,i nach einem Tabelleneintrag' fur 
das Extent, 

2, - Auf jedem Speichersystem 4 ist ein Bereich reser- 

. viert , der eine Zuordnung zwischen virtueller 
Adres^e und physikalischer Adresse vornimmt. Das 
Computers|ystem sucht zuerst nach' der virtuellen 
Adresse des Extents. Falls diese Adresse noch nicht 
reservieirt ist, sucht das Computersystem nach exner 

noch f reien Adresse auf idem Speichersystem 4 

• • • . 

Wird die Koordination nicht du'rch eine zentrale Instanz 
vorgenommen, so muss diese Auf gabe nach Figur 1 von 
einem oder mehreren der angeschlossenen Computersysteme 
ubernommen werden, Weiterhin konnen jedoch auch ein 
Oder mehrere dedizierte Gerate, die als * SAN-Appliances 
5 beizeichnet werden, zur .Koordination deir Computer- 
systeme gemaS Figur 2 an das Speichernetzwerk 1 ange- 
schlossen werden. Neben der Entlastung der Computer- 
systeme um die Koordination kann durch den Einsatz von 
SAN-Appliances 5 ' sichergestellt werden, dass alle 
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angeschlosseneh Computersysteme die gleiche Sicht auf 
die SpeicHersysteitie 4' haben, d. li. zum gleichen Zeit- 
punkt uber das Verlassen bzw.' Hinzul^oiranen van Spei'clier- 
systemen 4 inf ormiert "werden. 

5 ■ 

Die SAN-Appliance 5 bietet somit eine Reihe voix. 
Sclmittstellen, uber die Inf oirmationen zwischeh dem 
SAN-Appliances 5 und den Client- Re chn.em 3 ausgetauscht 
werden konnen, Diese xamfassen: 
0. • . * 

- Ahfrage der Grundkonf iguration von. jedem Client 3, 

- Anfrage nacli neuen Extents vbn jedem Client 3, 
Information der Clients 3 liber Verandernngen der 
Inf rastruktur.. 

15 

Das Share -Verfahr en kann auch in so genannte In-Band- 
» Appliances integriert warden (siehe Figur 3) . Bei den 
In-Band-Appliances handelt es sich. . um dedizierte. 
Systeme, die 'eine Trains format ion der logischen Adresse 
20 eines patenblocks; die sie von den angeschlossenen 
Computer systemen erhalten, in die physikalische Adresse 
vornehmen. Der Einsatz. von in-Band-Appliajices ist dann 
notwefidig, wenn die Funktionalitat d3r Share -Strategie 
nicht in die QomputerSysteme direkt integriert werderi 
25 kann, da keine Software -Version der Share -Strategie fur 
diese Computersysteme verfugbar ist oder die Leistung 
der angeschlossenen Computersysteme nicht ausreichend 
groS ist, urn die Transformation der logischen Adressen 
in die physikalischen Adressen dur chzuf uhren . 

30 • 

Eine In-Band- Appliance verha^lt sich aus Sicht der Spei- 
chersysteme 4 wie ein angeschlossenes Computersystem, 
aus der Sicht der .an die In-Band-Appliance 



angeschlossenen Computersysteme wie .ein physikalisches 
Speichersystem. , 

In dem Speichernetzwerk 1 konnen -In-BcLnd-Appliances mit 
Computersystemen, in den^ii die Share -Strategie ausg^- 
fuhrt wird, gemischt werden. 

Aufbau . von Internetsystemen mit Hilf e der Sh'are- 
Strategie: * 

Die Problemstellung beim Aufbau von Systemen zur Aus- 
lieferurig ' von Datehob j ekten .uber das Internet 
unterscheidet sich von dem Aufbau von Speichersystemen 
in sbfern; dass Clients 3 in dem Internet keine globale 
Sicht uber alle verfugbaren Web- Server und Web-Cacbes 
in dem System haben. Soil ein Datum von einem Wfeb-Cache 
gelesen werden, um die teilnehmenden Web- Server zu 
entlasten, muss also sichergestellt werden, dass der 
Client . 3 . mindestens.. einen zu einem Datenobjekt 
gehorenden Web-*-Cache kennt. und das zu iesende Daten- 
objekt auGh dem richtigen Web-Cache zuordnisn kann. • 

Diese Auf gabenstellung k^nn im Allgemeinen nicht gelost 
werden, ohne dass von einem Datenobjekt mehrer^ Kopien 
angelegt werden, die \iber die ' Web- Caches gemafi einer 
vorgegebenen Platziemingsstrategie verteilt werden . 
Werden von einem System von jedem Datenobjekt k Kopien 
gespeichert, so fragt der Client 3 hacheinander Oder 
gleichzeitig bei den 'k Web-Caches nach, von denen er 
glaubt, dass sie eine • Kopie des Datenobj ektes spei- 
chern. Halt einer der Web-Caches eine Kopie des Daten- ' 
Ob j ektes, so wird diese Kopie anschlieSend von dem 
Client 3 gelesen. 
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Die Anzahl der notwendigen Kopien, damit ein Client 3 
einem Datenobjekt mindestens einen ' Vifeb- Cache zuordnet, 
der auch dieses Datenobjekt speichert, ist von der 
verwendeten . Verteilungsstrategie und den relativen 
Kapazitaten C = .(ci/. Cn) der Web-Caches abhangig. 

Weiterhih. ist , sie von der Sidht (vx, Vn) des 

Clients 3 abhangig, das heifit von den relativen GroSen 
der WiBb- Caches, die der Client 3 zu kennen glaubt . Die 
Konsistenz Kv der . Sicht eines Clients 3 wird wie' folgt 
0 . def iniert : « . 

n 

yr^ = ^min[v,.,cj 

/=i . • • 



Es 'fcann gezeigt werden, dass bei Verwendung der Share- 
15 Strategic die Verwendung von ©(log N) Kopien ausrei- 
chend ist, um mit einer Wahrscheinlichkeit von groEer 

als 1^1— -^J ^arantieren zu konnen, das^ mindestens fur 

ein Datenobjekt der Web-Cache, der von- der Share- 
Strategie berechnet wird, fur C und V derselbe ist • 

20 

Di^ Erfindung ist nicht beschrankt auf die hier darge- 
stellten Ausf uhrung'sbeispiele . Vielmehr ist 'es moglich, 
durch Kombination und Modifikation der genannten Mittel 
und Merkmale weitere Ausf uhrungsvarianten zu realisie- 
25 • ren, ohne den Rahmen der Erfindung zu verlassen. 
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1 Speichernetzwerlc 

2 switclxes bzw. Roster 

3 ' Client 

4.. Datenspeiclxersyste^ 

6 obere Bits 
7. untere Bits 
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Satentanspruche 

Verfahren zur randomisierten Datenspeicherung iri 
Speichernetzwerken. imd/oder' einem Intranet, xind/ 
Oder dem Internet , * ' 

dadurch gekenn?eichnet , dalS 

eine Menge von Datenblocken D± (i=l, .../ m) einer 
Menge von IDatenspeichersystemen Sj n) 
gemaS den folgenden Schritten zugeordnet uxid dort 
gespeichert wird: 

a) der Gesamtmenge der Datenspeichersysteme ,wird 
ein virtueller Speicherraum urid jedem einzel- 
nen Datenspeichersystem Sj n) durch 
einen ersten Zuf allsprozeiS mindestens ein 
Teilraxim I-| des virtuellen Speicherraiims 
zugeordnet, wobei das Verbal tnis zwischen dem 
Teilraiim Ij .und dem gesamten virtuellen ' Spei- 
cherraum wenigstens naherungsweise dem Ver- 
haitnis der auf*. das Datenspeichersystem Sj 
bzw. auf die Gesamtmenge der Datenspeicher- 
systeme bezogenen Werte eines vorgebbaren 
Parameters entspricht, 

b) jedem Datenblock Pi (i=l/ .-./ m) wird durch 
einen zweiteh' Zuf allsprdzefi ein (zuf alliges)' 

, Element .h(i) des- virtuellen Speicherraums • 
zugeordnet, 

c) fur jeden Datenblock Di (i=l, m)- wird 
mindestens ein Teilraum" Ik ermittelt, in dem 
h(i) enthalten ist, tind der Datenblock Di min- 
destens einem der durch diese (n) Teilraume 
(Teilraum) Ijc ' reprasentierfcen Datenspeicher- 
system S]c zugeordnet und dort gespeichert . 
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. Verfahren nach Anspruch 1/ 
dadurch ' gekennzeidhnet , dalS 

bei.. dem ersten und/oder zweiten Zuf allsprozeS 

pseudo-zuf allige Funktionen angewendet werden. 

Verfahren nach einem der Anspruche 1 oder 2, 
dadurch gekenn-zeichnet , daS 

Datenspeichersysteme Sj, deren. Wert Cj des vorgeb- 
baren Parameters einen ebenfalis vorgebbaren 



zweiten Wert 5 iibersteigt, • in 



neue virtuelle 



Datenspeichersysteme Sj. mit Cj. .5 und - falls 
* 5 # 0 - in' ein weiteres virtuelles 



IDatenspeicher system Sk mit c^ = Cj 



zerlegt werden und diesen virtuellen Datenspei- 
. chersystemen durch den ersten Zuf allsprozeS je- 

weil's mindestens ein Teilraum Ij/ bzw. 1^ des vir- 
^tuellen Speicherraums zugeordnet wird, wobei la I 

den ganzzahligen ' Anteil einer Zahi a e IR be- 

schreibt . 



Verfahren nach einem der vorangehenden Anspruche, 
dadurch gekennzeichnet / daS 

der virtuelle SpeiGherraum durch da^ Intervall 
[0,1) urid die Teilraume Ij, durch mindestens ein in 
[0,1) enthaltenes Teilihtervall reprasentiert 

werden. 



Vdrfahren nach einem der vorangehenden Anspruche, 
dadurch gekennzeichnet, daS 



im ersten Zuf allsprozefi durch die Aiiwendung einer 
ersten Hash-Funktion g(j) der • linke Rand des 
Intervalls Ij ermittelt . und die" Ldnge des 
Intervalls gemaS (g(j) + s * a^} berechnet wird, 
mit 

Cji Wert des auf das Datenspeichersystem Sj 

bezogenen Parameters *\ind 
s: Stretch-Faktor/ der so- gewahlt ist,- dafi • 

s * 6j < 1 erfiillt ist. • 

Verfahren nach einem der vorahgehenden Anspruche, 
dadurch gekennzeichnet , daJS. 

der Stretch-Faktor s derart gewahlt . wird, dass das 
Intervall [0, 1)_ vollstandig durch die Teilinter- 
yalle' Ij liberdeckt wird. ^ ^ » . 

Verfahren nach einem der vorangehenden Aaspruche, 
dadurch gekennzeichnet , dalS 

im' zweiten ZufallsprozeS durQh die Aawendung eirler 
zweiten .Hasji-Funktion h(i) jedem Datenblock Di 
---r m) eine . Zahl h(i). e [0,1) zugeordnet 

wird. 

Verfahren n^^ch einem- der vorangehenden Anspriiche, 
dadurch gekennzeichnet , daE 
der vorgebbare Parameter 

die physikalische Kapazitat von Datehspeicher- 

systemen oder 

die An^ragelast yon Datenspeichersystemen be- 
schreibt oder 

Abweichungen von der gewunschten . Verteilung 
korrigieren." 



Verfahren nach pinem der vorangehenden Anspruche, • 
dadurch. gekennzeichnet / dais 

in dem Fall, dass das elnem Patenblock. Di zugeord- 
nete Element h(i) in mehreren' Teilraumeiji Ij ent- 
halten ist, eine uni forme ' Platzierungsstrategie 
angewendet. wird," urn den Datenblock Di eineiri der 
durch die Teilraume Ij- reprasentierten Datenspei- 
chersystem zuzuordnen. • , 

Verfahren nach einem der vorangehenden Anspriiche, 
dadurch gekennzeichnet, dafi 

bei Andeningen mindestens eines der Werte, 
C= (ci, ... , , Cn) des vorgebbaren Parameters eine 
erneute Zuord^ung der Datenblocke . Di zu den 
Datenspeichersystemen Sj nach dem Verfahren zur, 
randomisierten Datenspeicherung gemaS einem der 
Anspruche 1 bis 9 nnter Zugrnndelegung der.^neuen 
Parameterwerte, Cea., c^J erf olgt . 

Verfahren nach einem der vorangehenden Anspruche, 
dadurch gekennzeichnet, dalS 

bei Anderungen mindestens eines der Werte " 
C= (cx, . . . , Cn) des vorgebbaren Parameters eine 
erneute Zuordnung der Datenblocke Di . zu • den 
Datenspeichersystemen Sj nach dem Verfahren zur 
randomisierten Datenspeicherung gemaS einem der 
Anspruche 1 bis 9 unter Zugrundelegung der neuen 
Parameterwerte C'=(cx^, . . . , c^.; nur erfolgt, wenn 
ein neuen Parameterwert Ci* sich von dem ent- 
sprechenden aktuellen Parameterwert ci um eine 
vorgebbare Konstante \i unterscheidet . 
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Verfahren nach einem der vorangehenden Anspruche , ■ ■ 
dadurch* gekeionzeichnet, daE 

bei Andemjngen mindestens eines • der Werte 
C= (ci, . . . , Ca) des vorgebbaren ■. iParameters in 
^ einen neuen Parameterwert G'=(ci,, Cn') stu-' 

fenweise eine erneute Zuordnung der Datenblocke Di 
zu den Datenspieichersystemen Sj nach dem Verfahren 
zur randomisierten Datenspe'icherung gemaS einem 
der Anspruche 1 bis 9 . erfolgt, wobei in jeder 
Stufe k Zwischen- Parameterwert e (c^i, . . c^,; 
mit |ci - c*i| jT' lci - c'il (i.= 1, n) zugriin- 

degelegt werden. ' 

Verfahren nach einem der vorangehenden Anspiriiche, 
dadurch gekennzeichnet ; daE . 

zur Abspeicherring der Datenblocke in einem Spei- 
chermediiam mindestens eine Tabelle bereitgestellt 
wird, in denen die Zuordnung zwischen virtueller 
Adresse. und physikalischer Adresse auf . dem Spei- 
chermedium abgespeichert ist . 

Verfahren nach Anspruch 13 , 
dadurch gekennzeichnet, dalS 

mehrere Datenblocke zu einem Extent ' zusammen- * 
gefasst werden, denen in der Tabelle eine gemein- 
same physikalische Adresse auf dem Speichermedium 
zugeordnet wird,- wobei die Datenblocke eines ; 
Extents im logigchen Adressraum miteinander ver- 
bunden sind, indem der erste Datenblock eines aus 
2^ Datenblocken bestehenden Extents eine Adresse 
der Form x00...000 erhalt, wobei die iinteren A . 
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Bits durch die Zif fer Null reprasentiert sihd, der 
letzte Block dieses Extents die Adresse xll.,^.lll 
erhS.lt, wobei .die untersten A Bits durch die Zif- 
fer Bins reprasentiert sind, imd die physikalische 
Position eines Datenblocks durchi eine' Addition des 
Tabelleneihtrags fur den zugehorigen Extent mit 
den letzten X Bits der logischen Adresse des 
Datenblocks gewonnen wird. 

Anordnung mit mindestens einen Prozessor,. der 
(die) derart eingerichtet ist (sind) , dafi ein Ver- 
f ahren zur randomisierten Datenspeicherung = in 
Speichernetzwerken iind/oder einem Intranet und/ 
Oder dem Internet durchfuhrbar ist, wobei die 
randomisierte Datenspeicherung die Verfahrens- 
schritte gemaS einem der Anspruche 1 bis 14 
umfasst. 

Anordnung^ nach Anspruch 15 , 
dadurch gekennzeichnet , daS 

die Anordnung ' .. 

mindestens einem Datenspeichersystem und/oder 
mindestens einem Computersystem, das (die) 
lesend . und/oder schreibend auf die Speicher- 
medien zugreift (zugreifen) , und/oder 
mindestens eine zwischen das (die) Comput er sy- 
stem (e) und das (die) Datenspeichersystem (e) 
geschaltete Kontroller-Einheit zur isteuerung 
des Verfahrens randomisierten Datenspeicherung 

\imfasst. 



Anordnung nach Anspruch 16, 
dadurch gekennzeichnet , daS 



5. 
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'das Datenspeichersystem • 
. - ' Pestplattienf elder und/oder 

als Web-Cashes ausgebildete Zwischenspeicher 
ximf asst . * 

18. Anordnung nach einem der Anspruche 15, bis 17, 
dadurch gekeqiJizeichnet , daS 

die Anordnung mindestens eine .zwischen das (die) 
Computersystem(e) • und das (die) Datenspeicher- 
system (e) geschaltete . Kontroller-Einheit zur 
Steuerxing des Verfahrens zur randomisierten Daten- 
speicherung umf asst . * 



19 i Anordnung nach Anspruch 18 , 

15 dadurch gekenrizeichnet , daS 

die Anordnung mindestens ein liber die Kontroller- 
Einheit auf die Speichermedien zugreifendes 
Computersystem umf asst: 



2 0 2 0. • Anordnung nach einem der Anspruche 15 bis 19, 
dadurch gekennzeichnet , daE 

das Verf ahren . zur- randomisierten Datenspeicherung 
als Hardware-RAID-Verf ahren in der Kontroller-Ein- 
heit implementiert ist. 

25 

21. Anordnung nach einem der Anspruche 15 bis 20, 
dadurch gekennzeichnet, daI5 

die Anordnxang , ' 

- mindestens ein dediziertes, iiber Mittel' zum 
30 Datenaustausch mit Speichermedien und Computer- 

systemen der Anordnung vferbundehes Computer- 
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system. (SAN- Appliance) zur Koordiriation der 
Datehspeicherung und/oder 

iiber Mittel zum Dat^naustauscli mit Speicher- 
medien und Computersystein.en der Anordnung ver- 
^ bundene Rechenressourcen (In-Band-Appliances) 
zur Verteilung der Datenblocke 
umfasst. ...» 

Ahordnimg . nach einem der Anspruclie 15 bis 21 > 
.dadurch gekeiinzeichnet , daS 

die . Anordnung heterogene Speichermedien ximfasst. 

Computerprogrammprodukt , das ein compxiterlesbares 
. Speichermedium umfaSt, auf dem eiii Progranun ,ge- 
speichert ist, das es einem Computer ermoglicht/ 
nachdem es in den Speicher des Computers geladen 
worden ist, ein Verfahren zur randpmisierten 
Datenspeicherung in Speichemetzwerken und/oder 
•einem Intranet und/oder dem . Internet durchzu- 
fiihren, wobei die randomisierte Datenspeicherung 
die Verf ahrensschritte gemaS einem der Ahspruche 1 

bis 14 umf aSt . 

* 

Computerlesbares Speichermedium, auf dem ein Pro- 
gramm gespeichert ist, das es einem Computet er- 
moglicht, nachdem es in den Speicher des Computers 
geladen worden ist, ein Verfahren zur randomi.- . 
sierten Datenspeicherung . in Speichemetzwerken 
und/oder, einem . Intranet und/oder dem Internet 
durchzufuhren, wobei die randomisierte Datenspei- 
cherung die Verfahrensschritte gemaS einem der 
Anspruche 1 bis 14 umfaSt. 
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Zusanmenfassung 

Die vorliegende Erf'indiing beschr'eibt ein Verfahren xind 
eine. Anordnung zur raxidomisierten Datenspeicherung in 
Speichernetzwerken und/oder ■ einem Intranet und/oder dem 
Internet . sowie ein entsprechendes . Computerprogranun-Er- 
zeugni3 * und ein entsprechendes computerlesbares Spei- 
chermedium, welche insbesondere einsetzbar sind fdr die 
Verteilung und das ^Wiederauf f inden yon Daten in fehler- 
toleraiiten sowie f eblerbehaf teten Systemen, wie bei- 
spielsweise Speictiernetzwerke oder dem Internet. 
Hierfur wird verge schlageii, dass bei dem Verfahren zur 
randomisierten Datenspeicherung in Speichernetzwerken 
und/oder einem Intranet und/oder dem Internet jedem 
Speichersystem ein oder mehrere Intervalle zugeordnet 
werden, deren GesamtgroSe der. relativen Kapazitat des 
Systems entspricht. Diese Inteiyalle werden auf ein 
[0, 1) -Intervall abgebildet/ k6nnen sich aber im 
Gegensatz zu fruheren Strategien mit anderen Inter- 
vallen uberlappen. Jedem Da tenb lock wird . niin mittels 
einer" (pseudo- ) zuf alligen Funktion ein reeller Punkt 
im [0, 1) -Inter-vall zugewiesen. Dieser Punkt kann 
eventuell. zu mehreren Intervallen von Speichersystemen 
gehoren. Falls dem so ist, wird eine \aniforme 
Plat zierungsstrategie verwende t , um den " Datenblock ' 
einem dieser Speichersysteme zuzuweisen. Verandern sich 
nun die relativen Kapazitaten der Speichersysteme, so 
werden die Intervalllangen entsprechend angepasst. 

- Fig; 1 ' * • 
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